# import  requests
# from bs4 import BeautifulSoup
#
# # 获取连接
# url='http://www.shanghairanking.cn/rankings/bcur/2020'
# reponse=requests.get(url=url)
# reponse.encoding='utf-8'
# soup =BeautifulSoup(reponse.text,'html.parser')
# list=soup.select('table > tbody > tr')
# for i in list:
#     array=i('td')
#     print(array[0].string.replace('\n',''),array[1].text.replace('\n',''),array[2].text.replace('\n',''),array[4].text.replace('\n',''))
#
#
import xlrd
from xlrd import xldate_as_tuple
import datetime
'''
xlrd中单元格的数据类型
数字一律按浮点型输出，日期输出成一串小数，布尔型输出0或1，所以我们必须在程序中做判断处理转换
成我们想要的数据类型
0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error
'''
class ExcelData():
    # 初始化方法
    def __init__(self, data_path, sheetname):
        #定义一个属性接收文件路径
        self.data_path = data_path
        # 定义一个属性接收工作表名称
        self.sheetname = sheetname
        # 使用xlrd模块打开excel表读取数据
        self.data = xlrd.open_workbook(self.data_path)
        # 根据工作表的名称获取工作表中的内容（方式①）
        self.table = self.data.sheet_by_name(self.sheetname)
        # 根据工作表的索引获取工作表的内容（方式②）
        # self.table = self.data.sheet_by_name(0)
        # 获取第一行所有内容,如果括号中1就是第二行，这点跟列表索引类似
        self.keys = self.table.row_values(0)
        # 获取工作表的有效行数
        self.rowNum = self.table.nrows
        # 获取工作表的有效列数
        self.colNum = self.table.ncols
        print(self.rowNum,self.colNum)

    # 定义一个读取excel表的方法
    def readExcel(self):
        # 定义一个空列表
        datas = []
        for i in range(1, self.rowNum):
            # 定义一个空字典
            sheet_data = {}

            # for j in range(self.colNum):
            #     # 获取单元格数据
            #     c_cell = self.table.cell_value(i, j)
            #
            #     sheet_data[self.keys[j]] = c_cell
            #     # 循环每一个有效的单元格，将字段与值对应存储到字典中
            #     # 字典的key就是excel表中每列第一行的字段
            #     # sheet_data[self.keys[j]] = self.table.row_values(i)[j]
            # # 再将字典追加到列表中
            # datas.append(sheet_data)
        # 返回从excel中获取到的数据：以列表存字典的形式返回
        return datas
if __name__ == "__main__":
    data_path = "IMS基线核查结果.xlsx"
    sheetname = "Sheet4"
    get_data = ExcelData(data_path, sheetname)
    datas = get_data.readExcel()
    #     # print(datas)